1
Fundamentos Geométricos da Otimização Convexa
MATH008Lesson 8
00:00
Imagine navegar por um terreno complexo onde seu objetivo é encontrar o ponto mais próximo de segurança. Na linguagem da otimização, essa 'segurança' é um conjunto $C$, e a ação de encontrar o ponto mais próximo é uma projeção. Embora a intuição sugira que sempre existe um único ponto 'mais próximo', a realidade matemática é mais sutil. A base geométrica da otimização convexa repousa na formalização da 'proximidade', indo além da intuição euclidiana para representações funcionais rigorosas como as funções indicadora e de suporte.

1. Projeções e Distâncias

A distância de um ponto $x_0$ a um conjunto $C$ é definida como o infimum de todas as distâncias possíveis a pontos dentro do conjunto:

$\text{dist}(x_0, C) = \inf\{\|x_0 - x\| \mid x \in C\}$

O otimizador específico que alcança esta distância é o operador de projeção:

$P_C(x_0) = \text{argmin}\{\|x - x_0\| \mid x \in C\}$

Para um hiperplano simples definido por $a^T x = b$, a projeção tem uma solução fechada elegante: $P_C(x_0) = x_0 + (b - a^T x_0)a/\|a\|_2^2$. No entanto, para conjuntos gerais, este problema permanece como uma otimização restrita: minimize $\|x - x_0\|$ sujeito a $f_i(x) \leq 0$ e $Ax = b$.

2. Geometria Funcional

Para tratar restrições geométricas como componentes objetivos, empregamos dois poderosos 'espelhos' funcionais:

  • A Função Indicadora $I_C(x)$: $I_C(x) = \begin{cases} 0 & x \in C \\ +\infty & x \notin C \end{cases}$. Isso colapsa a geometria em uma penalidade numérica.
  • A Função de Suporte $S_C(x)$: $S_C(x) = \sup_{y \in C} x^T y$. Isso caracteriza o conjunto por seus hiperplanos limitantes em todas as direções.
Teorema: Teorema de Motzkin

Um conjunto não vazio e fechado $C \in \mathbf{R}^n$ é um conjunto de Chebyshev (com uma projeção única para cada $x_0$) se e somente se for convexo.

Esboço da Prova (Unicidade)

Suponha que $C$ seja convexo e que a norma seja estritamente convexa. Se houvesse dois pontos distintos mais próximos $u, v \in C$ com $\|u - x_0\| = \|v - x_0\| = d$, então seu ponto médio $w = (u+v)/2$ estaria em $C$ (por convexidade).

Pela convexidade estrita da norma: $\|w - x_0\| = \|\frac{1}{2}(u - x_0) + \frac{1}{2}(v - x_0)\| < \frac{1}{2}\|u - x_0\| + \frac{1}{2}\|v - x_0\| = d$.

Isso contradiz a suposição de que $d$ era a distância mínima. Assim, a projeção deve ser única.

Aviso 8.4: Dependência da Norma

Muitas vezes construímos um hiperplano separador usando: $(P_C(x_0) - x_0)^T (x - (1/2)(x_0 + P_C(x_0))) = 0$. Cuidado! Esta construção específica é válida apenas para a norma euclidiana. Normas gerais exigem tratamentos mais sutis da ortogonalidade.

🎯 Ideia Central
A convexidade é o 'cola' que garante a estabilidade na otimização geométrica. Sem ela, até mesmo a tarefa simples de 'encontrar o ponto mais próximo' pode resultar em soluções múltiplas e conflitantes, levando à instabilidade algorítmica.